Scholar Hub/Chủ đề/#k means/
K-means là một thuật toán trong học không giám sát được sử dụng để phân nhóm dữ liệu không được gán nhãn vào các cụm khác nhau. Thuật toán này hoạt động bằng cá...
K-means là một thuật toán trong học không giám sát được sử dụng để phân nhóm dữ liệu không được gán nhãn vào các cụm khác nhau. Thuật toán này hoạt động bằng cách xác định các cụm dựa trên sự tương đồng giữa các điểm dữ liệu trong không gian. Mục tiêu của thuật toán là làm cho các điểm dữ liệu trong cùng một nhóm giống nhau nhất có thể và khác với các điểm trong nhóm khác. K-means là một trong những thuật toán phân cụm đơn giản và phổ biến được sử dụng rộng rãi trong các lĩnh vực như xử lý ảnh, khai phá dữ liệu và học máy.
K-means là một thuật toán phân cụm được áp dụng trên dữ liệu không được gán nhãn, trong đó mỗi mẫu dữ liệu được gán vào cụm gần nhất dựa trên sự tương đồng giữa chúng. Thuật toán này được phát triển bởi Stuart Lloyd vào năm 1957 và sau đó được nhà toán học người Pháp Jean-Pierre Hartigan và Marc Vittert khám phá lại và phổ biến trong năm 1963.
Cách hoạt động của thuật toán K-means như sau:
1. Chuẩn bị dữ liệu: Chuẩn bị dữ liệu và chọn số cụm K mà chúng ta muốn dự đoán. Số lượng cụm cần được xác định trước khi chạy thuật toán.
2. Khởi tạo ngẫu nhiên các trung tâm cụm ban đầu: Chọn ngẫu nhiên K điểm dữ liệu làm trung tâm ban đầu cho các cụm.
3. Gán mỗi điểm dữ liệu vào cụm gần nhất: Với mỗi điểm dữ liệu, tính toán khoảng cách của nó đến các trung tâm cụm và gán điểm dữ liệu vào cụm có trung tâm gần nhất.
4. Cập nhật trung tâm cụm: Tính toán trung tâm mới cho mỗi cụm bằng cách lấy trung bình của tất cả các điểm dữ liệu thuộc cụm đó.
5. Lặp lại các bước 3 và 4 cho đến khi sự thay đổi giữa các trung tâm cụm liên tiếp ít hơn một ngưỡng xác định hoặc đạt đến số lần lặp tối đa.
6. Đầu ra: Kết quả cuối cùng của thuật toán K-means là một tập hợp các cụm, mỗi cụm bao gồm các điểm dữ liệu được gán vào cùng một cụm.
Thuật toán K-means có một số ưu điểm, bao gồm tính đơn giản, hiệu quả tính toán và khả năng mở rộng cho các tập dữ liệu lớn. Tuy nhiên, nó cũng có một số hạn chế, như nhạy cảm với vị trí ban đầu của các trung tâm cụm và không đảm bảo tìm ra kết quả tối ưu toàn cục. Để thực hiện thuật toán K-means, có thể sử dụng các ngôn ngữ lập trình như Python, R, và MATLAB.
Hướng Tới Một Phương Pháp Luận Phát Triển Tri Thức Quản Lý Dựa Trên Bằng Chứng Thông Qua Đánh Giá Hệ Thống Dịch bởi AI British Journal of Management - Tập 14 Số 3 - Trang 207-222 - 2003
Tiến hành một đánh giá về văn liệu là một phần quan trọng của bất kỳ dự án nghiên cứu nào. Nhà nghiên cứu có thể xác định và đánh giá lãnh thổ tri thức liên quan để chỉ định một câu hỏi nghiên cứu nhằm phát triển thêm cơ sở tri thức. Tuy nhiên, các bản đánh giá 'mô tả' truyền thống thường thiếu tính toàn diện, và trong nhiều trường hợp, không được thực hiện như những mảnh ghép đích thực củ...... hiện toàn bộ #phương pháp đánh giá hệ thống #nghiên cứu quản lý #phát triển tri thức #bằng chứng #chính sách #thực hành #quản lý thông tin #khoa học y học
Phân Hiện Biểu Hiện Khác Nhau Của RNA Thông Tin Eukaryote Bằng Phương Pháp Chuỗi Polymerase Dịch bởi AI American Association for the Advancement of Science (AAAS) - Tập 257 Số 5072 - Trang 967-971 - 1992
Cần có những phương pháp hiệu quả để xác định và tách biệt những gen có biểu hiện khác nhau trong các tế bào khác nhau hoặc trong các điều kiện thay đổi. Báo cáo này mô tả một phương pháp để phân tách và nhân bản các RNA thông tin (mRNA) riêng lẻ thông qua phản ứng chuỗi polymerase. Yếu tố chính là sử dụng một bộ các mồi oligonucleotide, một mồi được gắn vào đuôi polyadenylate của một tập ...... hiện toàn bộ Các phương pháp đơn giản để cải thiện khả năng giải thích của các hệ số hồi quy Dịch bởi AI Methods in Ecology and Evolution - Tập 1 Số 2 - Trang 103-113 - 2010
Tóm tắt 1. Các mô hình hồi quy tuyến tính là một công cụ thống kê quan trọng trong các nghiên cứu tiến hóa và sinh thái. Thật không may, những mô hình này thường cho ra những ước lượng và kiểm nghiệm giả thuyết không thể giải thích được, đặc biệt là khi các mô hình bao gồm sự tương tác hoặc các hạng tử đa thức. Hơn nữa, các sai số chuẩn cho c...... hiện toàn bộ Xúc tác Asymmetric với Nước: Giải Quyết Kinetics Hiệu Quả của các Epoxide Cuối Bằng Phương Pháp Thủy Phân Xúc Tác Dịch bởi AI American Association for the Advancement of Science (AAAS) - Tập 277 Số 5328 - Trang 936-938 - 1997
Các epoxide là những khối xây dựng đa năng cho tổng hợp hữu cơ. Tuy nhiên, các epoxide đầu có thể được coi là phân nhóm quan trọng nhất của những hợp chất này, và hiện chưa có phương pháp tổng hợp tổng quát và thực tiễn nào cho việc sản xuất chúng dưới dạng tinh khiết đồng phân. Các epoxide đầu có sẵn với giá rất rẻ dưới dạng hỗn hợp racemic, và giải quyết động học là một chiến lược hấp dẫ...... hiện toàn bộ #epoxide #xúc tác không đối xứng #thủy phân #giải quyết động học #cobalt chiral #1 #2-diol